当期目录 | 2022年第2期
当期目录
主编寄语
促进图书情报学科研究与业务实践的融合
曾建勋
知识组织
科技文献算法嵌套实体识别
刘齐凯,李鹏程,陆 伟,程齐凯
基于情感词典的引文文本情感识别研究
左任衔,唐振华,黄 晓,吴 江
基于BERT-MLDFA的内容相近类目自动分类研究——以《中图法》E271和E712.51为例
李湘东,石 健,孙倩茹,贺超城
基于改进LDA模型的铁路领域主题发现研究
龙艺璇,安 源,王东晋,翟夏普,伊惠芳
外文数据库英译中文作者姓名消歧实践
朱玉强,江 涛,李翼飞
音乐领域知识图谱构建框架研究
杨 媛
资源与服务
ORCID的现状、风险与对策
窦天芳,张书华,张 蓓
德国数字图书馆建设实践及特色
闫 健
数字版权视域下的数字人文应用平台构建模式研究
欧阳剑
科研项目立项视角下开放政府数据领域研究状况分析
武 琳,张 秀
主编
寄语
促进图书情报学科研究与业务实践的融合
曾建勋
向上滑动阅览
任何领域的发展都存在学界与业界、理论与实践相互作用的两个方面,学科理论源于实践,并指导业务工作,业务实践基于学科理论,并丰富学科体系内涵。当前,在图书情报领域似乎存在两个阵营,一个是以信息管理学院(系)为代表的学院派,另一个是以图书馆情报所为代表的馆所派,学院派侧重图书情报理论与方法研究、信息资源管理专业人才培养,注重体系化的学科建设;馆所派侧重信息资源建设与服务、情报研究与决策支撑工作,注重实用性的手段建设。这两个阵营间似乎“各不相干、互不相容”,图书情报学科研究追求“全、新、优”,较少关注图书馆情报所的实际需求,而图书馆情报所的业务则强调对实践问题的解决,比较少地关注图书情报的理论方法,结果,导致学院派与馆所派相互脱节,形成两张皮,致使图书情报学科边界不清,文献信息业务范畴模糊。
图书情报领域产生上述现象的原因是多方面的,既有外部环境上大数据、云计算、人工智能给业态带来的冲击,又有数字资源形态和用户行为变化给图书情报领域带来的颠覆性变革影响;既有面对出版传媒、文献情报、数据文件、智能计算等知识内容行业不断跨界融合,使得人才培养方向定位变得模糊,不知为谁培养人才,培养什么样的人才;又有教师沿袭从书本到书本的研究,为了评职称而做研究,过分追捧新概念、新术语,缺乏对实践问题与需求的感知,以至于“犁了别人的地,荒了自家的田”,即使发表大量的学术论文,也无法指导实际工作;还有很多馆所工作人员没有接受过图书情报专业训练,按部就班,安于现状,疏于变革,沉沦于重复性、事务性、简单性工作,对学术研究的关注不够,轻视业务的专业性,缺乏对专业问题进行研究的能力和动力。
要打破图书情报领域的这种壁垒,填补理论与实践中的鸿沟,需要重新审视图书情报学科方向和业务定位,增强学科的应用属性,强化业务的基准规范,推进学科研究与业务实践的融会贯通、交叉融合与开放创新。一方面,学科建设需要从实践中来,到实践中去,注重应用场景的构建,把论文写在科技信息交流平台上,融入文献信息服务之中,推动图书情报业务实践不断变革与超越,这才是最终检验学科理论效用所在;另一方面,业务实践需要把握图书情报工作发展规律,锚定业务范畴和目标,遵循业务流程和标准规范、凝练算法和方法,在实践中发现问题、分析问题、解决问题,丰富理论框架和学科体系。同时,要推动图书情报领域学术生态联盟的形成,一方面要将馆所作为图书情报教育的实习基地,将业务经验与困惑带入课堂之中,推进专业人才的共同培养,崇尚专业热爱、职业精神与学有所用;另一方面加强教师与馆员的交流互访,创建联合实验室,提倡教师在馆所兼职或进行客座研究,鼓励馆员讲学讲课,寻求共同的研究选题与研究计划,致力于解决领域重大关切,释放文化传承与知识传播价值,发挥“耳目、尖兵、参谋”作用,形成“文献库”“信息库”“知识库”与“思想库”的学科优势。
科技文献算法嵌套实体识别
刘齐凯,李鹏程,陆 伟,等
本文探讨了科技文献中算法实体的自动识别研究,着重研究嵌套型算法实体的识别优化问题。首先通过远程监督学习的方式构建算法实体训练语料,再引入数据增强技术扩充语料规模,最后应用BartNER模型实现科技文献中嵌套算法实体的自动识别。实验结果显示,在引用数据增强技术的基础上BartNER模型取得了76.66%的F1值,证明该方法对嵌套算法实体识别的有效性,同时证明数据增强策略能够有效提升嵌套算法实体的识别效果。
引文格式:刘齐凯,李鹏程,陆伟,等. 科技文献算法嵌套实体识别[J]. 数字图书馆论坛,2022(2):2-9.
基于情感词典的引文文本情感识别研究
左任衔,唐振华,黄 晓,等
基于情感分析的引证行为研究通过揭示科研论文引用情感的普遍规律,进而探究引证行为的规律。本研究以OpinionFinder英文情感词典为基础,借助SO-PMI算法计算引文文本中词语的点互信息值来判断词语之间的语义相似度,从而构建了优化的引文领域情感词典。本研究从PLOS ONE期刊数据库收集了信息检索领域1 045篇文献的65 976处引用进行实证分析。结果表明,这些引用中有84.02%为中性引用,13.11%为正向引用,2.87%为负向引用。本研究可以为其他引文领域情感词典的构建,以及在更大规模引文数据中的应用提供借鉴。
引文格式:左任衔,唐振华,黄晓,等. 基于情感词典的引文文本情感识别研究[J]. 数字图书馆论坛,2022(2):10-17.
基于BERT-MLDFA的内容相近类目自动分类研究——以《中图法》E271和E712.51为例
李湘东,石 健,孙倩茹,等
针对《中图法》中具有关联度大、区分度小等特点的内容相近类目,探讨利用深度学习来提升分类效果的方法。本文构建BERT-MLDFA模型,即通过多层级注意力机制对BERT不同层参数进行动态融合,并在任务数据集上预训练,进而以《中图法》中E271和E712.51作为典型内容相近类目进行自动分类实验。结果表明:本文方法的Macro_F1值达到0.987,相较于经典机器学习方法提升2.4%,而且该方法可以捕捉内容相近类目文本之间的细微语义差别,能够较好地应用于《中图法》以及其他内容相近类目分类,具有较强普适性。
引文格式:李湘东,石健,孙倩茹,等. 基于BERT-MLDFA的内容相近类目自动分类研究——以《中图法》E271和E712.51为例[J]. 数字图书馆论坛,2022(2):18-25.
基于改进LDA模型的铁路领域主题发现研究
龙艺璇,安 源,王东晋,等
高效挖掘海量铁路领域科研成果数据中蕴含的主要内容是铁路领域科研人员在大数据时代亟待解决的重要问题。LDA模型是用于主题发现的主流方法,但在面向多单词短语居多的铁路领域研究文献时存在使用受限的问题,因此本文提出一种LDA模型的改进算法:一方面在构建主题模型前,对文本作预处理时抽取语料中的名词短语、动词短语、名词和动词;另一方面在主题模型构建完成后,融合TextRank算法与PMI算法得出关键词组块,并以此替换LDA主题识别结果中的主题词,进一步丰富主题的语义。最后,以铁路领域“牵引供电系统”为例开展实证研究。结果表明,本文提出的改进LDA模型有助于提升铁路领域主题发现结果的可解释性与可识别性,可以为后续铁路领域科研管理中知识服务的实现提供有效的方法支持。
引文格式:龙艺璇,安源,王东晋,等. 基于改进LDA模型的铁路领域主题发现研究[J]. 数字图书馆论坛,2022(2):26-32.
外文数据库英译中文作者姓名消歧实践
朱玉强,江 涛,李翼飞
针对外文数据库英译中文作者姓名存在多记录指向同一人或同记录指向不同人等情况,模拟人工排检法,整合多源数据、学术社交网络、知识百科及在线翻译网站等语料库,利用网页文档对象自动操作、正则表达式、短文本相似度计算等技术编制程序开展英译中文作者姓名消歧实践。结果表明,算法架构稳定有效、扩展性强,成功率得到从业人员认可,为数据预处理和清洗工作提供了新思路和新方法。
引文格式:朱玉强,江涛,李翼飞. 外文数据库英译中文作者姓名消歧实践[J]. 数字图书馆论坛,2022(2):33-39.
音乐领域知识图谱构建框架研究
杨 媛
音乐领域知识图谱是多模态知识图谱的典型应用,其建设难度远大于文本知识图谱,目前尚处于探索发展阶段。本文在研究国外现有音乐知识图谱的基础上对音乐知识图谱的特征进行分析,再按照知识获取、知识融合、知识检索与推理、可视化展示4个环节对音乐知识图谱的构建框架进行设计,并对推进我国音乐知识图谱的构建提出建议。
引文格式:杨媛. 音乐领域知识图谱构建框架研究[J]. 数字图书馆论坛,2022(2):40-46.
ORCID的现状、风险与对策
窦天芳,张书华,张 蓓
ORCID是全球学者唯一标识。本文通过系统调研阐述ORCID的发展现状及运营机制,深入分析ORCID的数据采集机制和数据共享规则。同时结合翔实数据评估ORCID对学术领域的影响及其带来的数据垄断风险,最后提出我国加强学者身份标识建设的对策建议。
引文格式:窦天芳,张书华,张蓓. ORCID的现状、风险与对策[J]. 数字图书馆论坛,2022(2):47-52.
德国数字图书馆建设实践及特色
闫 健
德国数字图书馆的数字资源服务成绩瞩目。鉴于我国尚无关于德国数字图书馆建设的专门研究,本文对德国数字图书馆的创立背景、创设宗旨、组织架构及运作流程进行详细考察,发现德国数字图书馆是为应对谷歌之挑战及推动学术研究而产生,具有极为鲜明的跨馆别、跨文献类型特征,既是德国数字资源的统一检索和访问入口,也是合作伙伴之间有效的沟通平台,对我国国家数字图书馆建设有一定启示。
引文格式:闫健. 德国数字图书馆建设实践及特色[J]. 数字图书馆论坛,2022(2):53-59.
数字版权视域下的数字人文应用平台构建模式研究
欧阳剑
数字人文应用平台是数字人文基础设施的组成部分,其构建模式的选择直接影响人文数据及研究工具的使用方式,相关研究对数字人文开发与应用具有重要意义。数字版权是目前数字人文应用平台构建模式的主要影响因素,本文对数字人文应用平台模式进行论述与归纳,并对数据开放型、数据封闭型、混合型3种主要的数字人文应用平台构建模式特点进行分析,论述了3种模式应用平台的应用场景,从数字人文应用平台构建模式选择实践来看,混合型数字人文应用平台模式比较符合目前的使用现状。
引文格式:欧阳剑. 数字版权视域下的数字人文应用平台构建模式研究[J]. 数字图书馆论坛,2022(2):60-66.
科研项目立项视角下开放政府数据领域研究状况分析
武 琳,张 秀
本文对我国开放政府数据研究领域科研项目立项情况进行全面调研,共搜集到110项已立项的科研项目。经研究分析,发现开放政府数据研究在科研立项上呈现典型的区域特点、团队特点和学科特点,首先立项项目集中于经济发达、研究机构聚集、政府开放数据建设先进的区域,其次研究团队呈年轻化态势且成长快速,最后在学科上呈现图书情报学、公共管理学和法学多学科交融的特点。开放政府数据领域研究主题聚焦于政策解读与经验借鉴、数据质量与共享利用、数据能力与开放能力、平台建设与评估评价,其研究新态势包括隐私风险成为关注热点、价值开发释放数据要素原动力、重点关注可持续发展的数据生态系统。
引文格式:武琳,张秀. 科研项目立项视角下开放政府数据领域研究状况分析[J]. 数字图书馆论坛,2022(2):67-72.
制版编辑 | 于东红
长按二维码关注我们
官网|http://www.dlf.net.cn
邮箱|DLF@istic.ac.cn
电话|010-58882324